Использование тематических моделей в извлечении однословных терминов (Application of Topic Models to the Task of Single-Word Term Extraction)
نویسندگان
چکیده
В статье представлены результаты экспериментов по применению тематических моделей к задаче извлечения однословных терминов. В качестве текстовых коллекций была взята подборка статей из электронных банковских журналов на русском языке и англоязычная часть корпуса параллельных текстов Europarl. Эксперименты показывают, что использование тематической информации значительно улучшает качество извлечения однословных терминов независимо от предметной области и используемого языка.
منابع مشابه
Сеть естественных иерархий терминов новостных текстов по событиям «Евромайдана» (Network of Natural Hierarchies of Terms of News Messages on the "Euromaydan" Events)
Построение большой тематической онтологии – сложная и затратная проблема. Определенным этапом разработки общих онтологий является формирование словарных номенклатур, терминологических онтологий. Эффективный автоматический отбор отдельных терминов для таких конструкций на основании неразмеченных текстовых массивов – не решенная окончательно задача [5, 6]. Проблема автоматического установления св...
متن کاملОтображениe моделей данных NoSQL в объектные спецификации (Mapping of the NoSQL Data Models to Object Specifications)
Системы баз данных, принадлежащие к классу NoSQL, используются для обеспечения горизонтального масштабирования данных и работы со сверхбольшими объёмами данных. При решении задач над множественными неоднородными информационными ресурсами необходимо их использовать. В статье рассмотрены подходы к отображению моделей NoSQL разных видов в объектную модель языка СИНТЕЗ, используемого в качестве уни...
متن کاملMultiservice Telecommunication Systems Parametrical Synthesis by using of Multilayer Graph Mathematical Model
This study is devoted to the problem of parametric synthesis of multi-service telecommunication systems. The main characteristics of telecommunication systems, which are brought to account in an article, are multilayer structure formed by the overlayed networks and presence flows with self-similarity effect. For accounting these features of modern telecommunications systems is proposed to use a...
متن کاملیک مدل موضوعی احتمالاتی مبتنی بر روابط محلّی واژگان در پنجرههای همپوشان
A probabilistic topic model assumes that documents are generated through a process involving topics and then tries to reverse this process, given the documents and extract topics. A topic is usually assumed to be a distribution over words. LDA is one of the first and most popular topic models introduced so far. In the document generation process assumed by LDA, each document is a distribution o...
متن کاملTheoretical and Experimental Investigations of DNA Open States
Аннотация. Работа посвящена обзору и анализу литературных данных, касающихся свойств открытых состояний ДНК. Данные состояния возникают вследствие крупных флуктуаций дуплекса и оказывают большое влияние на целый ряд биохимических процессов, в том числе на перенос электрического заряда в ДНК. Проведён сравнительный анализ экспериментальных данных по кинетике и термодинамике открытых состояний ДН...
متن کامل